I spent a few weeks building a Neuro-Symbolic Manufacturing Engine. I proved that AI can design drones that obey physics. I also proved that asking AI to pivot that code to robotics is a one-way ticket to a circular drain. Per pastarąsias kelias savaites dokumentuoju savo kelionių statybą , AI sistema, galinti išversti neaiškius vartotojo ketinimus į skrydžio įrodytą aparatūrą. OpenForge Tikslas buvo išbandyti „Google“ mąstymo galimybes. Norėjau atsakyti į konkretų klausimą: ar LLM gali peržengti Python scenarijų rašymą ir iš tikrųjų inžinerizuoti fizines sistemas, kuriose svarbu tolerancija, įtampa ir suderinamumas? Gemini 3.0 Atsakymas, paaiškėja, yra sudėtingas „Taip, bet...“ Štai post-mortem apie tai, kas dirbo, kas nepavyko, ir kritinis skirtumas tarp Kodas ir ir sistemų. Generating Refactoring Žymės: Drone_4 Works Pirma, geros naujienos. „drone_4“ saugyklos filialas yra sėkmingas. Jei klonuosite repą ir paprašysite "Ilgojo nuotolio kino drono", sistema veikia nuo sėklų iki modeliavimo. 
 
 
 
 Ji supranta ketinimus: ji žino, kad „Cinema“ reiškia sklandų skrydį, o „Long Range“ reiškia GPS ir Crossfire protokolus. Jis paklūsta fizikai: Suderinamumo variklis sėkmingai atmeta variklio ir akumuliatoriaus derinius, kurie gali perkaisti ar sprogti. Jis imituoja realybę: USD failai, sukurti NVIDIA Isaac Sim, iš tikrųjų skrenda. Aš pripažįstu, aš turėjau būti pragmatiškas. „Make_fleet.py“ aš šiek tiek „apgaudinėjau“. Aš mažiau pasitikėjau LLM, kad dinamiškai išrastų laivyno logiką, o daugiau - kieto kodavimo Python orchestrą. Turėjau priminti sau, kad tai buvo „Gemini 3.0“ argumentų testas, o ne konkursas, kad pamatytumėte, ar galėčiau išvengti vieno kodo eilutės rašymo. Kaip koncepcijos įrodymas -kur LLM tvarko kūrybinį vertimą, o Python tvarko fizikos dėsnius - OpenForge yra pergalė. Neuro-Symbolic AI Nesėkmė: kvadrupus pivot Antroji iššūkio pusė buvo paimti šį darbo variklį ir pasukti jį. norėjau paversti Drone Designer į Robot Dog Designer (Ranch Dog). Aš maitinau „Gemini 3.0“ visą kodų bazę (88k žetonų) ir paprašiau jo refaktoriaus. I am officially shelving the Quadruped branch. Tai tapo akivaizdu, kad tai, kaip aš pradėjau šį sūkurį, nuvedė mane į apvalią drenažo triušio skylę problemų sprendimo srityje. Jei noriu pastatyti Ranch Dog, turiu žengti žingsnį atgal ir pastatyti jį nuo nulio, naudodamas „Drone“ variklį tik kaip atskaitos modelį, o ne pagrindą perrašyti. Žyma: plokščiavidurių efektas Kodėl „Drone“ variklis pavyko, o „Quadruped“ refaktorius žlugo? Tai susiję su konkrečiu elgesiu, kurį pastebėjau „Gemini 3.0“ (ir kitais aukšto konteksto modeliais). Kai statysite nuo pat pradžių, jūs ir AI statysite architektūrą žingsnis po žingsnio. Tačiau, kai jūs prašote LLM esama programa, ji nemato kodo istorijos. ji nemato mūšio randų. pivot 
 
 
 Originalus Drone kodas buvo suskirstytas į atskirus, linijinius žingsnius. Buvo konkrečių klaidų tvarkymo vartų ir laukimo būsenų, atsiradusių dėl ankstesnių nesėkmių. Gemini 3.0, bandydamas būti efektyvus, Jis sujungė skirtingus loginius žingsnius į unikalius, monolitinius procesus. Ant paviršiaus kodas atrodė švaresnis ir labiau Pythonic. bet iš tikrųjų jis pašalino struktūrines apkrovas nešančias sienas, kurios išlaikė taikymo stabilumą. flattened the architecture Jis suprato, kad kodas yra stiliaus vadovas, o ne struktūrinė būtinybė. Galimybių paradoksas: Dvyniai 2.5 vs 3.0 Šis projektas pabrėžė kontraintuityvią tikrovę: Gemini 2.5 was safer because the code it confidently spit out was truncated pseudo-code. Ankstesnėse versijose išėjimai buvo struktūrizuoti, kad parodytumėte, kaip galėtumėte eiti apie statybą. Tada turėtumėte sukurti planą, kad galėtumėte sukurti programos viduje esančius audinius. 
 
 
 "Gemini 2.5" privertė mane būti architektu. turėjau eiti programą po programos, išmatuodamas tiksliai tai, ko norėjau. "Gemini 3.0" turi greitį ir motyvaciją tai padaryti vienu metu. "Gemini 3.0" sukuria kodą, kuris iš karto atrodo veikiamas, bet yra struktūriškai sugedęs viduje. Galutinis nuosprendis Jei norite sukurti generacinį gamybos variklį arba bet kokią sudėtingą sistemą su LLM, čia yra mano galutiniai "OpenForge" eksperimento patarimai: 
 
 
 
 Greenfield yra lengva, Brownfield yra sunku: LLM puikiai tinka statybai nuo nulio. Jei norite pakeisti programos paskirtį, neprašykite AI perrašyti X. Vietoj to, išmatuokite senosios programos logikos srautą ir paprašykite AI sukurti naują programą, naudojant tą loginį žemėlapį. Architektūra vis dar yra karalius: Jūs negalite matyti kodų bazės kaip skysto dokumento, kurį gali pakeisti LLM. "OpenForge" įrodė, kad mes galime užpildyti atotrūkį tarp neaiškių vartotojų ketinimų ir fizinės inžinerijos. Tai sakė, Gemini 3.0 yra didžiulis šuolis nuo 2.5. dalis to, ką aš tyrinėju čia, yra tai, kaip gauti geriausią iš visiškai naujo įrankio.

Range

Read My Stories

Connect with me Here

Šis garso įrašas sukurtas originalia istorijos kalba!

Kodėl "Gemini 3.0" yra puikus statybininkas, bet vis dar reikia žmogaus

About Author

KOMENTARAI

PABAIGTI ŽYMES

ŠIS STRAIPSNIS BUVO PRISTATYMAS

Related Stories

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps